Internet Archive en mode dégradé suite au piratage de la semaine dernière
Wayback brocken machine
Le site de la fameuse bibliothèque numérique qui archive le web fonctionne en mode très dégradé. La semaine dernière, il a subi une fuite de données concernant 31 millions d'utilisateurs et une attaque DDoS, sans pour autant que le lien entre les deux soit établi.
Le 14 octobre à 11h50
4 min
Société numérique
Société
Au milieu de la semaine dernière, on apprenait qu'Internet Archive avait été piratée. Des données de 31 millions d'utilisateurs ont fuité, dont les adresses e-mails, pseudonymes, dates de changement de mot de passe, mots de passe hachés en Bcrypt des utilisateurs concernés et d’autres données internes.
Mais les serveurs de l'organisme américain à but non lucratif ont été aussi ciblés par une attaque DDoS. Si aucune information ne permet de lier les deux actes de piratage contre Internet Archive, leur concomitance met à mal la présence en ligne de la bibliothèque très connue pour son service d'archivage du web Wayback Machine.
Le site Have I been Pwned avait confirmé la fuite après avoir reçu la liste des comptes concernés. Il ajoutait que 54 % des comptes qui y figuraient étaient déjà listés dans sa base.
Seule la Wayback Machine disponible, en mode dégradé
Cinq jours après, le site d'Internet Archive affiche une page d'excuse annonçant que la plupart des services de l'organisme sont encore indisponibles.
Son fondateur, Kahle Brewster, explique ce lundi matin sur X que la Wayback Machine « a repris de manière provisoire », mais seulement « en lecture seule ». On peut donc de nouveau consulter les archives du web, mais il est encore impossible d'ajouter de nouvelles pages ou la mise à jour d'une page dans la Wayback Machine.
Il ajoute que l'activité d'Internet Archive va pouvoir reprendre en toute sécurité, mais « que cela pourrait nécessiter une maintenance supplémentaire ».
Jeudi, il expliquait que les équipes de l'organisme avaient désactivé la bibliothèque JS utilisée lors de l'attaque, nettoyé les systèmes et amélioré la sécurité sans plus de précision. S'il pensait, à ce moment-là, avoir repoussé l'attaque DDoS, quelques heures plus tard, Kahle Brewster était obligé d'annoncer que les attaquants étaient de retour.
D'autres projets touchés
Il signalait d'ailleurs qu'Open Library, projet de catalogage de tous les livres publiés créé en collaboration avec Aaron Swartz notamment, était aussi victime de cette attaque. Si l'inaccessibilité des sites d'Internet Archive touche tous les internautes, elle est particulièrement problématique pour tous les bibliothécaires. Nombre d'entre eux utilisent des services qui s'appuient eux-mêmes sur ceux d'Internet Archive.
Les chercheurs sont aussi touchés. Par exemple, la Biodiversity Heritage Library (BHL), projet de numérisation de la littérature scientifique sur la biodiversité, repose en partie sur Internet Archive. Le site affiche actuellement un bandeau expliquant qu' « Internet Archive est actuellement en panne. Par conséquent, les images des pages ne s'affichent pas dans BHL ».
Un service uniquement assuré par Internet Archive
Ce constat montre l'importance qu'a prise Internet Archive pour l'archivage et les services liés aux bibliothèques à travers le monde. Aucun autre service similaire n'existe sur Internet, ce qui, de fait, centralise l'archivage d'Internet et rend dépendants les internautes des services d'Internet Archive. Il faut dire que l'archivage du web n'est pas une tâche de tout repos. L'année dernière, l'une des « petites mains » du service, Corentin Barreau, nous expliquait son travail au sein d'Internet Archive.
En France, la Bibliothèque nationale de France (BnF) archive depuis 2002 des milliers de sites internet. Mais cet archivage n'est pas aussi simple d'accès que celui d'Internet Archive. Jusqu'en 2014, il fallait se déplacer à Paris, dans les locaux de la BnF pour pouvoir les consulter. Depuis, il est possible d'y accéder sur le site d'autres établissements, et notamment dans des bibliothèques de province. Mais ce service reste indisponible de chez soi.
La BNF a d'ailleurs récemment signé des partenariats concernant des projets d'IA dont l'entrainement reposeraient sur son incroyable réservoir de données. Mais il n'est pas question, pour l'instant, que son fond soit directement accessible à tous les internautes.
Internet Archive en mode dégradé suite au piratage de la semaine dernière
-
Seule la Wayback Machine disponible, en mode dégradé
-
D'autres projets touchés
-
Un service uniquement assuré par Internet Archive
Commentaires (3)
Abonnez-vous pour prendre part au débat
Déjà abonné ? Se connecter
Cet article est en accès libre, mais il est le fruit du travail d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles
Profitez d’un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vousLe 14/10/2024 à 14h33
Modifié le 14/10/2024 à 16h19
Nous Ici, à la BNF, Nous Nous Devons de Préserver la Sereine Majesté, la Dignité, la Noblesse, la Supériorité et la Grande Finesse Gastronomique de nos Archives, Que l'On ne Saurait Jeter en Pâture à... la populace (Oh, Vingt Dieux, Comme ce Mot est Vulgaire !!!), Pourquoi ne pas Donner du Caviar au Cochons, Tant que Vous y Êtes ?
(Uh, uh, uh , je m'étonne parfois moi-même de l'acuité géniâââââle de mon noble esprit, directement hérité des Lumières !)
Le 15/10/2024 à 20h36